DAY13 如何評估機器學習模型的好與不好 5/30

2024 iThome 鐵人賽

DAY 13

AI/ ML & Data

機器學習與深度學習背後框架與過程論文與實作系列第 12 篇

16th鐵人賽

2024-08-20 22:49:59

287 瀏覽

分享至

損失函數（Loss Function）是機器學習模型中非常關鍵的概念，用來衡量模型預測值與真實值之間的差距。在機器學習過程中，我們的目標是找到一組模型參數，使得這個差距最小化。損失函數的作用就是定量化這個差距，指導模型參數的調整。

損失函數的作用

損失函數可以被認為是機器學習中的“導師”。它告訴模型預測是否偏離了真實值，以及偏離的程度。每一次模型進行預測後，損失函數都會計算一個數值（即損失值），並將這個數值反饋給模型。基於這個損失值，模型會進行自我調整，以期在下一次預測時減小這個損失值，從而提高預測的準確性。

常見的損失函數類型

損失函數有很多種，根據不同的任務類型，選擇合適的損失函數至關重要。

均方誤差（Mean Squared Error, MSE）
- 適用於回歸問題，用來衡量預測值與真實值之間的差距。計算方法是將預測值與真實值的差值平方，然後取所有樣本的平均值。
- 公式：
  [
  MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2
  ]
- 特點： MSE 對於大的誤差更加敏感，因為差值被平方後放大了誤差的影響。
均絕對誤差（Mean Absolute Error, MAE）
- 也是用於回歸問題，這個函數計算預測值與真實值之間絕對差值的平均值。
- 公式：
  [
  MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|
  ]
- 特點： 與 MSE 相比，MAE 對於異常值（outliers）不敏感，因為它不會放大誤差。
交叉熵損失（Cross-Entropy Loss）
- 常用於分類問題，特別是二元分類和多元分類。這個函數用來衡量預測的概率分佈與實際標籤分佈之間的距離。
- 公式（對於二元分類）：
  [
  \text{Cross-Entropy} = - \frac{1}{n} \sum_{i=1}^{n} \left[y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i)\right]
  ]
- 特點： 當預測概率接近0或1而實際結果相反時，損失值會非常大，這樣有助於加速模型對錯誤的調整。
Hinge損失
- 主要用於支持向量機（SVM）模型，用於二分類任務。
- 公式：
  [
  \text{Hinge Loss} = \frac{1}{n} \sum_{i=1}^{n} \max(0, 1 - y_i \cdot \hat{y}_i)
  ]
- 特點： Hinge損失旨在最大化分類間的邊界（margin），從而提高分類的魯棒性。